Обзор курса: Неопределенность в эпоху GenAI

Урок 5 знаменует собой поворотный момент в COMP5511. Мы отходим от детерминированной логики классических вычислений и уверенности в результатах моделей ранней классификации, основанных на обучении с учителем, к вероятностному ядру генеративного ИИ. На этом занятии мы исследуем, почему современные модели ИИ выдают не "факты", а вероятностные распределения, раскрывая механизмы, позволяющие LLM писать стихи, а диффузионным моделям — рисовать из шума.

1. Смена парадигмы: от логики к вероятности

Помимо «ЕСЛИ-ТО»: переход от жестких правил к гибким статистическим вероятностям.
Конец определенности: понимание того, почему результаты GenAI по своей природе недетерминированы.
Вероятность как инструмент: как «эпоха GenAI» рассматривает неопределенность как особенность, а не как ошибку, которую нужно исправить.

2. Вероятностные движки творчества

Генеративный ИИ полагается на выборку из многомерных вероятностных пространств. При генерации текста или изображений модель ориентируется в неопределенности, чтобы создавать новое:

Большие языковые модели (LLM): предсказание следующего токена не как единичного выбора, а как распределения вероятностей.
Диффузионные модели: искусство обратного инжиниринга порядка из хаотичного Гауссовского шума.
Процесс выборки: как случайность используется для предотвращения повторяющихся и «роботизированных» выводов.

3. Агенты в непредсказуемых мирах

Автономные агенты должны ориентироваться в "открытых мирах", где каждое действие несет в себе степень неизвестного риска и вознаграждения.

Компромисс с галлюцинациями

Полностью детерминированные модели безопасны, но лишены оригинальности. Принимая неопределенность, мы позволяем творить, но также вносим риск галлюцинаций—когда модель уверенно генерирует правдоподобную, но ложную информацию.

Концептуальная логика выборки

Определить функциюGenerate_Response(
Prompt,Temperature)
:
Рассчитатьвероятностное распределение для всех возможных следующих токенов;
Скорректировать распределение в зависимости от Temperature(
Более высокая = большее разнообразие, Более низкая = большая сфокусированность)
;
Выбрать следующий токен с помощью взвешенного случайного выбора;
Повторять до завершения.

Вероятностное моделирование

Современный ИИ рассматривает мир через призму статистики, а не бинарных истин.